Loading…
中国上海
2019 年 6 月 24–26 日
单击此处了解更多信息和注册

点击此处查看英文版日程表。
To view the English version of this schedule please go here.

我们将为所有主题演讲和分组会议提供同声传译服务。
Simultaneous translation will be provided for all keynote and breakout sessions.

场馆 + 赞助商展示区地图
Venue + Sponsor Showcase Map
Tuesday, June 25 • 17:30 - 18:05
有效可靠地管理大规模 Kubernetes 集群 - 张勇和林志贤,蚂蚁金服

Sign up or log in to save this to your schedule, view media, leave feedback and see who's attending!

Feedback form is now closed.
随着业务的增长,我们需要将 Kubernetets 部署到世界各地的多个数据中心。单个数据中心中就拥有超过数万个节点。我们面临的关键挑战是如何高效、可靠地在数据中心内管理多个大规模 Kubernetes 集群。

在本次演讲中,我们将分享实现大规模集群管理自动化的经验和实践。首先,我们将介绍全自动化节点生命周期管理,以及如何基于 NPD、Autoscaler 和自定义运算符自动发现和恢复节点故障。然后,我们将分享部署和升级 Kubernetes 集群的经验和解决方案。最后,我们将分享基于 Prometheus 和运算符的风险防控系统,该系统可确保集群可靠性,具有自动故障检测和隔离的能力。

Speakers
YZ

Yong Zhang

Senior Software Engineer, Ant Financial
A Senior Software Engineer of Ant Financial.
ZL

Zhixian Lin

Senior Software Engineer, Ant Financial
A Senior Software Engineer of Ant Financial.



Tuesday June 25, 2019 17:30 - 18:05 CST
619